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+ Usando MD + Ambientes para MD 


= Implementação e simulação = Principais tipos 
= Escrever código do zero = Baseados em telas e interfaces gráficas 
« Reaproveitar código = Baseados em biblioteca de funções (lego) 


a l l = Baseados em uma linguagem de programação 
= Utilizar um ambiente dedicado específica Res dad 


« Fornece ferramentas apropriadas para auxiliar = Funcionalidades 


o usuário ao longo de toda a simulação ; is 
aa Eca = Suporte a prê-processamento e análise de 
= Minimiza esforço do usuário resultados 


n EURO e realização de = Grande número de algoritmos de AM, técnicas 
experimentos estatisticas e ferramentas de visualização 
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4 Ambientes de MD WEKA o Pássaro 


= Comerciais = Pássaro típico da Nova Zelândia 
= SAS = Encontrado apenas lá 
= SPSS = Não voa 
« Matlab = Tamanho de uma galinha 
= Públicos = Alimentam-se de invertebrados e frutas 


= Rapid miner = Dócil em extremo 


= Knime = Quase foram a extinção 
= WEKA 
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WEKA o Pássaro 


Copyright: Martin Kramer (mkramerO wxs.nl) 
André Ponce de Leon de Carvalho 


Onde fica Waikato? 
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História do WEKA 


= 1994: 
= Primeira versão é disponibilizada 


= Interface TCL/TK e algoritmos de 
aprendizado escritos principalmente em € 


= Versão beta 


= 1996: 
= Primeira versão pública: WEKA 2.1 
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Weka o Ambiente 


Desenvolvido na Universidade de Waikato, NZ 


Mineração de Dados e Aprendizado de 

Máquina 

Escrito em JAVA 

= Distribuído por meio da licença de software livre 
da GNU 

Utilizada com diferentes propósitos 

= Ensino, pesquisa, aplicações 
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História do WEKA 


= 1992: 


= Submissão do projeto para financiamento pelo 
governo da NZ por Ian Witten 


= 1993: 
= Financiado aprovado pelo governo 
= Sigla WEKA criada por Geoff Holmes 
= Waikato Environment for Knowledge Analysis 
= Criação do formato ARFF por Andrew Donkin 
= Attribute-Relation File Format 
= Segundo rumores, Andrew's Ridiculous File Format 
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História do WEKA 


= 1997: 
= Decisão de reescrever o código em Java 
= Tese de doutorado de Eibe Frank 
- 1998 
= Disponibilizado WEKA 2.3, última versão baseada 
em TCL/TK 
= 1998: 
= Disponibilizado WEKA 3 


= Primeira versão completamente em Java 
= Inclusão do módulo de desenvolvimento, com GUI 
= Compatível com livro do Wittel e Frank 
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+ Últimas Versões do WEKA + Ambiente WEKA 


= Várias versões foram desenvolvidas depois: = Possui vários módulos, que podem ser 
= WEKA 3.2: “versão GUI”, adiciona GUI (versão do utilizados para: 
livro usava linha de comando) 


WEKA 3.3: “versão de desenvolvimento” com E aies POE E SSamieiO de ago: 
várias melhorias = Uso de algoritmos de Aprendizado de 


WEKA 3.4: “versão do livro” compatível com Máquina 
segunda edição do livro Data Mining = Análise de resultados 


WEKA 3.6: última versão estável (3.6.7) 


= Visualização gráfica de dados e modelos 
WEKA 3.7: finalizada, mas ainda instável 


= Comparação de modelos (e algoritmos) 
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+ Ambiente WEKA + Ambiente WEKA 


= Com WEKA, é possível = 3 formas de usar 
= Abrir um conjunto de dados em diferentes = Aplicar um algoritmo de aprendizado a um 
formatos conjunto de dados e analisar a saída para 
= Pré-processar os dados por meio de filtros saber mais sobre os dados 
= Aplicar um algoritmo de AM aos dados = Usar modelos induzidos para gerar 
« Ajustar parâmetros dos algoritmos previsões para novos dados 
« Analisar os resultados obtidos = Comparar desempenho de diferentes 
« Utilizar diversas medidas de desempenho algoritmos para selecionar um deles 
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Ambiente WEKA + GUI do WEKA 


= Como usar WEKA? = Graphical User Interface 


= Linhas de comando = Ponto inicial para chamar as principais 
= À partir de programas em Java aplicações e ferramentas de suporte 


a Ru ICtoRes do WEKA utilizando suas = Possui quatro opções: 
- Permite escrever e testar novos algoritmos = Explorer 


= Usando GUI do Explorer = Experimenter 


= Mais fácil = KnowledgeFlow 
« Uma das opções do WEKA GUI Chooser = SimpleCL1 
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+ GUI do WEKA 


* Weka GUI Chooser = fx] 


Program Visualization Tools Help 


a P- 
2a WEKA 


The University 


âpplications 


of Waikato Experimenter 


| 


Wraikato Environment for Knowledge Analysis 
version 3,6,0 

(c) 1999 - 2008 

The University oF Wr'aikato 
Hamilton, New Zealand 
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+ Principais Opções 


= Explorer 
= Ambiente para exploração de dados 
= Experimenter 


= Ambiente para realização de experimentos 
e testes estatísticos 


= Permite comparar modelos 
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4 Explorer 


= Ferramenta gráfica de fácil uso que mostra as 


funcionalidades do software 
= Cada um dos principais pacotes disponíveis é 

representado na interface 

= Filtros 

= Algoritmos de classificação 

= Algoritmos de agrupamento 

= Algoritmos de associação 

= Algoritmos de seleção de atributos 

= Ferramenta de visualização 
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+ GUI do WEKA 


= Funcionalidades são acessadas por 


= Escolha de uma opção de um menu 


= Permite apenas as opções exibidas no 
momento da simulação 


= Preenchimento de valores em telas 


= Pré-preenchidos com valores default para 
obtenção de resultados com o mínimo de 
esforço 
= Entender os algoritmos e seu uso é 
importante para entender os resultados 
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Principais Aplicações 


= KnwoledgeFlow 


= Suporta mesmas funções que Explorer, além de 
aprendizado incremental 
= Permite trabalhar com fluxos de dados 


= Inclui interface drag-and-drop (arrastar e por) 
= SimpleCLT 
= Interface para linha de comando 


= Permite que comandos do WEKA sejam 
executados por sistemas operacionais que não 
possuem interface GUI 
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+ Explorer 


= Ferramentas de visualização permitem a 
análise em duas dimensões de: 
= Dados de um conjunto 
= Predições geradas por: 
= Modelos de classificação 
«= Modelos de agrupamento de dados 
= Possui vários painéis 
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+ KnowlegdeFlow + Experimenter 


= Permite colocar ícones representando = Ajuda a definir quando aplicar técnicas de 
algoritmos e fontes de dados na tela classificação (e de regressão) 
= E uni-los na configuração desejada = Que métodos e valores de parâmetros funcionam 


= Permite definir um fluxo de dados melhor para um dado problema? 


= Resposta não fácil 
= Conectando componentes representando ps 
= Permite comparar varios algoritmos de 
= Fontes de dados 


: aprendizado 
= Ferramentas de pré-processamento a eita A | 
a Algoritmos de aprendizado = HFode ser feito Interativamente com explorer 


Métodos de avaliação = Módulo Experimenter automatiza esse processo 


Módulos de visualização 
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He Experimenter + Documentação 


= Como automatiza? = Documentação online gerada 
« Torna mais fácil: automaticamente do código fonte 


= Executar algoritmos com: 


- Diferentes valores para seus parâmetros e m Unica fonte completa dos algoritmos 


- Vários conjuntos de dados disponíveis 
= Avaliar desempenho estatístico . À 
« Realizar testes de significância = WEKA esta continuamente em crescimento 


= Pode ser usado para distribuir carga em = Por ser gerada automaticamente a partir 
várias máquinas do código fonte, documentação online 
= Usando Java Remote Method Invocation (RMI) esta sempre atualizada 
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+ Prática + Perguntas 


= Entrar na ferramenta WEKA 
= Selecionar opção explorer 
= Carregar base de dados iris.arrf 
= Opção “Open file" 
= Carregar classificador J48 
= Opção “Classifier' 
= Em Classifier, opção "Choose" J48 
= Realizar experimento usando training set 
= Olhar resultados 
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